package com.tledu.jsoup;

import com.tledu.httpclient.HttpUtils2;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

import java.io.IOException;

public class Jsoup03 {
    public static void main(String[] args) throws IOException {
        // 涉及到复杂的选择，需要通过样式选择器，来定位到我们想要的新闻
        String xlHTML = HttpUtils2.get("https://sports.sina.com.cn/nba/", null);
        Document document = Jsoup.parse(xlHTML);
        // 写css选择器 缩小一下范围，我们想要的只有a标签
        Elements elements = document.select(".news-list-b a");
        for (Element el : elements) {
           // 针对每一项都可以进行一个爬取操作
//            System.out.println(el.attr("href"));
            // 针对每一个详情进行后续的操作
            String detailHtml = HttpUtils2.get(el.attr("href"), null);
            Document detailDom = Jsoup.parse(detailHtml);
            // 获取标题和内容
            System.out.print(detailDom.getElementsByTag("h1").text()+"   ");
            System.out.println(detailDom.select("span.date").text());
            System.out.println(detailDom.getElementById("artibody").text());
            System.out.println("============================================");
        }
    }
}
